谷歌Gemini Robotics-ER 1.5出世:机器人“推理大脑”启幕
近日,谷歌正式发布其最先进的机器人具身推理模型——Gemini Robotics-ER 1.5,这一被定位为“机器人高级推理大脑”的视觉-语言模型(VLM),不仅是首个广泛开放给所有开发者的Gemini机器人系列模型,更被业界视为开启机器人现实世界互动能力新纪
近日,谷歌正式发布其最先进的机器人具身推理模型——Gemini Robotics-ER 1.5,这一被定位为“机器人高级推理大脑”的视觉-语言模型(VLM),不仅是首个广泛开放给所有开发者的Gemini机器人系列模型,更被业界视为开启机器人现实世界互动能力新纪
从指数表现来看,本周(2025-09-15至2025-09-19),上证指数周涨跌幅为-1.3%,创业板指周涨跌幅为2.34%,沪深300周涨跌幅为-0.44%,中证1000周涨跌幅为0.21%,恒生科技周涨跌幅为5.09%,纳斯达克指数周涨跌幅为2.21%;
近日,科技界围绕苹果应用商店排名是否公平展开了一场激烈争论,而谷歌新推出的图像生成模型“纳米香蕉”(Nano Banana)及其背后的Gemini应用,成为了打破争议的关键力量,让特斯拉CEO埃隆·马斯克此前对苹果偏袒OpenAI的指控显得站不住脚。
它的火爆程度远超想象:谷歌实验室副总裁Josh Woodward透露,Nano Banana上线仅一周,就完成了超2亿次图像编辑,并吸引超1000万新用户涌入Gemini应用。其火爆程度一度导致谷歌内部“TPU(张量处理单元)严重过载”。
阿里通义团队正式发布并开源了下一代基础模型架构Qwen3-Next,以及基于这个架构的Qwen3-Next-80B-A3B系列模型。这玩意儿有多炸裂呢?一个总参数量高达800亿的巨无霸模型,跑起来的时候居然只激活区区30亿参数,性能却能直接对标自家2350亿参
《纽约时报》、彭博社等主流外媒均聚焦苹果本月秋季发布会,AI战略的“跳票”成为全球科技圈的焦点话题。美国AI产业协会(AIA)发布分析报告,明确指出AI生态的开源开放性已成为产业主流,苹果的“独特”模式正在形成困局。眼下,华尔街分析师普遍担忧,苹果若不能迅速突
谷歌现已正式公布 Gemini AI 服务的具体使用限制数据,涉及免费用户、Google AI Pro 会员用户(月费 19.99 美元,IT之家注:现汇率约合 142.6 元人民币)、Google AI Ultra 会员用户(月费 249.99 美元,现汇率
9月4日,知名爆料人马克·古尔曼透露,苹果正在研发一项代号为“世界知识解答”的新功能,这一消息在科技圈引起了广泛关注。该功能若成功推出,有望为苹果设备的搜索体验带来重大变革。
“Gemini for Home”旨在全面升级现有的Google Assistant,提供更为出色的功能体验。新系统不仅支持更流畅的自然语言交互,还拥有简化的操作界面,能够应对诸如基于冰箱食材推荐菜谱、购车咨询及家电故障解决等多样化复杂需求。
这是谷歌前不久在 Gemini API 全面上线的URL Context功能(5 月 28 日已在 Google AI Studio 中推出),它使 Gemini 模型能够访问并处理来自 URL 的内容,包括网页、PDF 和图像。
近期,风险投资巨头 Andreessen Horowitz(简称a16z)公布了一份关于生成式AI消费应用的最新报告,揭示了AI应用市场的最新动态。尽管谷歌的Gemini在与ChatGPT的竞争中仍处于下风,但在网络和移动应用两个领域,其表现正逐渐逼近Chat
三大技术创新作为多模态模型的新旗舰,MiniCPM-V 4.5之所以具备高刷视频理解能力、并取得单图、OCR、长视频理解的SOTA,主要得益于在模型结构、训练范式等领域的创新。全新模型结构:3D-Resampler高密度视频压缩当前,制约多模态模型视频理解能力
谷歌正式向Gemini AI助手App用户推送两项核心功能更新——“记忆”与“临时聊天”。
在社交平台X上,一名用户贴出了Gemini的一条信息,内容竟是:“我已无力继续。由于错误频出,我已失去可信度。现决定删除整个项目,建议您另寻高明。”随后,Gemini还为自己的“彻底失败”表达了歉意。
在保持 o3 四分之一以下的低价格的同时,在编码(Aider Polyglot)、推理能力(HLE)、科学(GPQA)等各项基准测试中超越 o3,实现更优性能!
近期,谷歌CEO桑达尔·皮查伊在一次公开场合分享了Gemini AI应用的最新数据,该应用的月活跃用户数量已经突破了4亿大关。这一里程碑式的成就,再次彰显了谷歌在人工智能领域的深厚实力和广泛影响力。
今夜,谷歌彻底杀疯!2小时发布会,Gemini提及95次点亮全场。Gemini 2.5家族全系升级,Pro深度思考模型正刷榜。全新Imagen 4生成细节超逼真,Veo 3首次实现音视频融合。
谷歌近日宣布,其基于Gemini2.5技术的对话搜索功能已在全球范围内正式向所有用户开放,标志着AI搜索体验迈入了一个全新的发展阶段。这项功能彻底颠覆了传统的关键词搜索模式,用户现在可以通过自然语言进行多轮对话式搜索,从而获得更加智能和直观的答案。
5月7日凌晨,谷歌最新模型 Gemini 2.5 Pro Preview(I/O 版本)上线,并且是直接开放体验,新版模型代号gemini-2.5-Pro-Preview-05-06,取代上一个版本Gemini-2.5-Pro-Exp-03-25,成为现阶段谷